package com.tledu.jsoup;

import com.tledu.httpclient.HttpUtils;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;

import java.io.IOException;

public class Jsoup2 {
    public static void main(String[] args) throws IOException {
        // 发现新的链接
        // 抽取这个csdn包含的其它链接的内容
        String csdnHTMl = HttpUtils.get("https://blog.csdn.net/wh_07/article/details/108213452");
//        System.out.println(csdnHTMl);
        // Jsoup的方式解析数据
        Document document = Jsoup.parse(csdnHTMl);
        // 发现csdn文章里热门文章，进而请求对应的热门文章的标题和时间
        // 根据css选择器选择到对应的标签
        Elements elements = document.select(".hotArticle-list a");
        for (Element el : elements) {
            System.out.println(el.text());
            System.out.println(el.attr("href"));
            System.out.println("-------------------");

            String sonHtml = HttpUtils.get(el.attr("href"));
            Document document1 = Jsoup.parse(sonHtml);
            System.out.println("标题:"+document.getElementById("articleContentId").text());
            System.out.println("时间:"+document.select(".bar-content .time").text());
        }
    }
}
